Support Vector Machine (SVM)

Machine Learning - পাইথন ডেটা সায়েন্স (Python Data Science) - Classification Algorithms

278

Support Vector Machine (SVM) একটি শক্তিশালী এবং জনপ্রিয় মেশিন লার্নিং অ্যালগরিদম যা মূলত Classification এবং Regression সমস্যা সমাধানে ব্যবহৃত হয়। এটি supervised learning অ্যালগরিদম যা ডেটাকে বিভিন্ন শ্রেণীতে বিভক্ত করতে সাহায্য করে। SVM-এর মূল উদ্দেশ্য হল একটি hyperplane খুঁজে বের করা যা শ্রেণীগুলিকে সবচেয়ে ভালোভাবে পৃথক করে।

SVM-এর মূল ধারণা

SVM-এর মূল ধারণা হল hyperplane ব্যবহার করে ডেটার মধ্যে শ্রেণী বিভাজন করা। যেহেতু আমাদের সাধারনত দুটি শ্রেণী থাকে (যেমন, positive এবং negative), তাই SVM একটি এমন hyperplane খুঁজে বের করতে চেষ্টা করে যা ডেটার দুটি শ্রেণীকে সবচেয়ে বড় মার্জিন দিয়ে আলাদা করবে।

১. Hyperplane

Hyperplane হল একটি বিশাল রেখা বা ফ্ল্যাট পৃষ্ঠ যা বিভিন্ন শ্রেণীর মধ্যে সীমারেখা হিসেবে কাজ করে। ২D-তে এটি একটি লাইন, ৩D-তে এটি একটি পৃষ্ঠ (plane), এবং আরো উচ্চ মাত্রায় এটি একটি সাধারণ রেখা।
SVM এর কাজ হল একটি optimal hyperplane খুঁজে বের করা যা শ্রেণীগুলির মধ্যে সবচেয়ে বড় মার্জিন তৈরি করে।

২. Margin

Margin হল দুটি শ্রেণীর মধ্যে hyperplane থেকে সবচেয়ে কাছের ডেটা পয়েন্টগুলোর মধ্যে দূরত্ব। SVM সর্বোচ্চ margin তৈরির চেষ্টা করে যাতে ক্লাসিফিকেশন নির্ভুল হয়।

৩. Support Vectors

Support Vectors হল সেই ডেটা পয়েন্টগুলি যা hyperplane থেকে সবচেয়ে কাছের অবস্থানে থাকে এবং ক্লাসিফিকেশন সমস্যার জন্য খুবই গুরুত্বপূর্ণ। এই পয়েন্টগুলির সাহায্যেই SVM হাইপারপ্লেনটি সঠিকভাবে ডিফাইন করে।

SVM-এর ধাপ

SVM-এর কাজের প্রক্রিয়া সাধারণত নীচের মত হয়:

Training Phase:
- ডেটাকে ইনপুট হিসেবে নিয়ে, এটি একটি optimal hyperplane এবং support vectors খুঁজে বের করে।
- এটি ডেটার মধ্যে শ্রেণী বিভাজন করতে চেষ্টা করে যাতে maximum margin থাকে।
Prediction Phase:
- একটি নতুন ডেটা পয়েন্টের জন্য, এটি hyperplane এর মাধ্যমে সঠিক শ্রেণী চিহ্নিত করে।

SVM এর বৈশিষ্ট্য

Non-linear decision boundaries: SVM রৈখিক (linear) এবং অরৈখিক (non-linear) ডেটার জন্য কাজ করতে পারে। অরৈখিক ডেটার জন্য, SVM kernel trick ব্যবহার করে যা ডেটাকে উচ্চ মাত্রায় মাপবে এবং ক্লাসিফিকেশন সমস্যাকে রৈখিক করবে।
Kernel Trick: Kernel function এমন একটি পদ্ধতি যা কম্পিউটেশনালভাবে দক্ষ উপায়ে, ডেটাকে উচ্চ মাত্রায় ম্যাপ করার জন্য ব্যবহৃত হয়। সাধারণত ব্যবহার করা কিছু kernel হল:
- Linear Kernel
- Polynomial Kernel
- Radial Basis Function (RBF) Kernel
Efficient with High Dimensionality: SVM উচ্চ মাত্রার (high-dimensional) ডেটার জন্য খুবই কার্যকরী, যেমন টেক্সট ক্লাসিফিকেশন (যেখানে প্রতিটি শব্দ একটি বৈশিষ্ট্য হতে পারে)।
Binary Classification: SVM সাধারণত বাইনারি ক্লাসিফিকেশন সমস্যায় ব্যবহৃত হলেও, এটি One-vs-One বা One-vs-Rest কৌশল ব্যবহার করে মাল্টিক্লাস ক্লাসিফিকেশনও করতে পারে।

SVM এর সুবিধা

High Accuracy: SVM অল্প সংখ্যক support vectors ব্যবহার করে ক্লাসিফিকেশন করে, যার ফলে এটি সাধারণত সঠিক এবং নির্ভুল ফলাফল প্রদান করে।
Works well with high-dimensional data: SVM-এ উচ্চ মাত্রার ডেটার জন্য ভাল কার্যকারিতা দেখা যায়, যেহেতু এটি kernel trick ব্যবহার করে।
Effective for large datasets: SVM বড় ডেটাসেটেও কার্যকরী, বিশেষ করে যদি ডেটাতে স্পষ্ট বিভাজন থাকে।
Versatile: SVM বিভিন্ন ধরনের kernel ফাংশন ব্যবহার করে যেকোনো ধরনের ডেটার সাথে কাজ করতে পারে।

SVM-এর সীমাবদ্ধতা

Computationally Expensive: SVM-এর প্রশিক্ষণ প্রক্রিয়া কিছুটা সময়সাপেক্ষ হতে পারে, বিশেষ করে যখন ডেটাসেট খুব বড় হয় বা অনেক ফিচার থাকে।
Difficulty in choosing the right kernel: সঠিক kernel function নির্বাচন করা কখনও কখনও চ্যালেঞ্জ হতে পারে এবং এটি কিছুটা পরীক্ষামূলক হতে পারে।
Sensitive to noise: SVM কিছুটা নোইজির (noisy) ডেটার জন্য কম কার্যকরী হতে পারে।

SVM এর ব্যবহার

Text Classification: SVM প্রায়শই ইমেইল স্প্যাম ফিল্টারিং বা টেক্সট ক্লাসিফিকেশন কাজের জন্য ব্যবহৃত হয়।
Image Classification: ছবি সনাক্তকরণ এবং ছবি শ্রেণীভুক্ত করতে SVM ব্যাপকভাবে ব্যবহৃত হয়।
Face Recognition: SVM মুখ চেনার ক্ষেত্রে ব্যবহার করা হয়।
Bioinformatics: SVM প্রোটিন বা ডিএনএ সিকোয়েন্সিং এর জন্য ব্যবহৃত হতে পারে।
Financial Market Prediction: SVM দ্বারা আর্থিক বাজারে স্টক প্রাইস বা ট্রেন্ড ভবিষ্যদ্বাণী করা যায়।

SVM মডেল তৈরি (Python উদাহরণ)

SVM মডেল তৈরি করতে Python এর Scikit-learn লাইব্রেরি ব্যবহার করা যেতে পারে। এখানে একটি সাধারণ উদাহরণ দেওয়া হল যেখানে SVM ব্যবহার করে একটি ক্লাসিফিকেশন মডেল তৈরি করা হচ্ছে:

# প্রয়োজনীয় লাইব্রেরি ইনপোর্ট
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# Iris dataset লোড
iris = datasets.load_iris()
X = iris.data
y = iris.target

# ডেটা ট্রেনিং এবং টেস্টিং সেটে ভাগ করা
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# SVM মডেল তৈরি
svm_model = SVC(kernel='linear')

# মডেল ট্রেনিং
svm_model.fit(X_train, y_train)

# পূর্বাভাস
y_pred = svm_model.predict(X_test)

# সঠিকতার হিসাব
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy * 100}%")

আউটপুট:

Accuracy: 100.0%

এখানে, আমরা Iris dataset ব্যবহার করেছি, এবং একটি linear kernel সহ SVM মডেল তৈরি করেছি। ট্রেনিং এবং টেস্টিং ডেটা ভাগ করার পর, মডেলটি সঠিকভাবে ক্লাসিফিকেশন করেছে।

সারাংশ

Support Vector Machine (SVM) একটি শক্তিশালী এবং জনপ্রিয় মেশিন লার্নিং অ্যালগরিদম যা শ্রেণীবিভাগ এবং রিগ্রেশন সমস্যার জন্য ব্যবহৃত হয়। এটি hyperplane এবং support vectors ব্যবহার করে শ্রেণী বিভাজন করে। SVM-এর সুবিধাগুলির মধ্যে উচ্চ নির্ভুলতা এবং উচ্চমাত্রার ডেটার জন্য কার্যকারিতা অন্তর্ভুক্ত। তবে এটি computationally expensive হতে পারে এবং সঠিক kernel নির্বাচন করা প্রয়োজন হতে পারে। SVM-এর সাহায্যে আপনি ইমেজ ক্লাসিফিকেশন, টেক্সট ক্লাসিফিকেশন, এবং অন্যান্য বিভিন্ন অ্যাপ্লিকেশনে কার্যকরী মডেল তৈরি করতে পারেন।

Content added By

SATT Academy

K-Nearest Neighbors (KNN) Decision Tree এবং Random Forest Naive Bayes Classifier Model Tuning এবং Hyperparameter Optimization

Support Vector Machine (SVM)

SVM-এর মূল ধারণা

১. Hyperplane

২. Margin

৩. Support Vectors

SVM-এর ধাপ

SVM এর বৈশিষ্ট্য

SVM এর সুবিধা

SVM-এর সীমাবদ্ধতা

SVM এর ব্যবহার

SVM মডেল তৈরি (Python উদাহরণ)

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

Support Vector Machine (SVM)

SVM-এর মূল ধারণা

১. Hyperplane

২. Margin

৩. Support Vectors

SVM-এর ধাপ

SVM এর বৈশিষ্ট্য

SVM এর সুবিধা

SVM-এর সীমাবদ্ধতা

SVM এর ব্যবহার

SVM মডেল তৈরি (Python উদাহরণ)

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!